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Identification of subunits in complex organic mols. or their 
fragments is effected by (a) specifically labelling the subunits with 
isotopes or stable small mols., (b) atomising and ionising the labelled 
subunits one after another, (c) detecting the resulting ions by 
real-time mass spectrometry,, and (d) processing the signals from the 
mass spectrometer to determine the length of protein (sic) by counting 
the no. of labelled subunits and identifying their specific labels. 

USE/ADVANTAGE - The process is esp. useful for sequencing nucleic 
acids, but may also be applied to other complex mols., e.g. proteins or 
peptides. The process eliminates laborious electrophoresis and 
autoradiography and is stated to remedy most of the drawbacks 
associated with prior art real-time techniques (cf. FR2558262, EP252683 
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Method for identifying the sequence of the bases of a nucleic acid, 
characterised in that it essentially comprises the following stages: A) 
production (2) of fragments of the nucleic acid; (B) specific chemical 
reactions (4) of bases so as to form chains of families of different 
sizes, each family comprising at each extremity a specific base; (C) 
specific labelling (6) of said families of chains and labelling of each 
nucleotide of each chain with stable isotopes stable small molecules 
directly graftable onto the nucleotides of said chains; (D) introducing 
(8) one at a time labelled chains into atomising and ionising means 
(26,28,30,32); (E) atomising and ionising (10) of each labelled chain 
by means of said means; (F) real time selecting and detecting (12) of 
ions formed as they form, by mass spectrometry and, (G) processing (14) 
signals derived from the mass spectrometer so as to determine the 
length of each chain by counting the number of labelled nucleotides of 
each ion detected and so as to identify the specific labelling of each 
family of chains. 
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Description 

L'invention se rapporte a un proceed et une installation d'identification des motifs d'une molecule 
organiqu complexe et en particulier d'une molecule biologique complexe telle qu'un acide nucleique , une 
5 proline, un peptide, un polymere. Ell s'applique dans les domaines du g£nie genetique, de la biologie, de 
la pharmacologic, tant au stade de ['experimentation, de la recherche fondamentale qu'industrielle. 

Le proc6de" de ('invention s'applique de fagon g^neVale a toute molecule constitute d'une succession 
d'acides amines, de nucleotides, de groupes d'atomes et, plus specialement, aux acides nucleiques, tels 
que I'ADN (acide desoxyribonucieique) et TARN (acide ribonucleique). 
70 L'identification des sequences ou de Pordre des nucleotides de I'ADN ou TARN est connue sous le nom 
de sequengage. 

Le sequengage des acides nucleiques a pris une rtelle importance dans le domaine de la biologie 
moleculaire et de la biotechnologie. En particulier, le sequencage de I'ADN permet I'analyse des genomes 
animaux, v£ge*taux et viraux dans des genes particuliers. Puisque la fonction d'une molecule biologique est 
75 determinee par sa structure, la definition de la structure d'un gene est cruciale pour la manipulation 
eventuelle de cette unite de base d'information. 

On rappelle qu'un nucleotide est forme par une base, un sucre et un phosphate. 

Pour les acides nucleiques, les bases sont des bases azotees posse*dant une structure heterocyclique 
du type purique ou pyrimidique ; elles sont au nombre de 4. Le sucre est le ribose pour TARN et le 
20 desoxy ribose pour I'ADN et le phosphate I'acide phosphorique. 

GeneValement, les nucleotides des acides nucieiques utilises sont triphosphates car e'est ce type de 
molecules qui fournit renergie necessaire au fonctionnement des enzymes dans de nombreuses reactions 
biochimiques, en particulier celles intervenant dans la polymerisation des ADN. 

L'ARN et I'ADN presentent trois bases communes : ('adenine (A) et la guanine (G) qui sont des purines 
25 et la cytosine (C) qui est une pyrimidine. L'autre base pyrimidique est la thymine (T) pour I'ADN et I'uracile 
(U) pour TARN. 

Pour I'ADN, les quatre types de nucleotides concernes sont le desoxy adenosine triphosphate ou dATP, 
le desoxy guanine triphosphate ou dGTP, le desoxy cytosine triphosphate ou dCTP et le desoxy thymine 
triphosphate ou dTTP. On les note ci-apres dXTP avec X = A, G, C ou T. 

30 L'ADN contient Information genetique complete necessaire a la fabrication des proteines, elements 
constitutifs de tout organisme vivant En particulier, chaque succession de trois bases est le code, par 
I'intermediaire des ARN messagers, d'un acide amine qui entre dans la composition d'une proteine. Le 
sequengage a pour but d'obtenir I'ordre des bases constituant un brin d'ADN ou d'ARN. 

Les methodes de sequengage de I'ADN comportent essentiellement 5 etapes qui sont (a) la fragmenta- 

35 tion du genome, (b) les reactions chimiques de sequengage pour former des chaTnes de nucleotides, (c) le 
marquage des chaTnes de nucleotides, (d) la separation des chaTnes marquees et (e) la detection. 

Etape a 

40 Un genome ou ensemble des secteurs de I'ADN est constitue par un grand nombre de paires de bases 
(13 x 10 s pour la levure et 3 x 10 9 pour I'homme). Le genome, du fait de sa longueur, ne peut etre 
directement soumis aux reactions de sequengage. L'ADN est scinde en fragments d'environ 1000 a 30000 
bases qui sont ensuite multiplies par clonage. Par exemple, cette fragmentation peut etre effectuee par 
('utilisation d'enzymes de restriction qui coupent I'ADN au niveau de certaines sequences ou par ['utilisation 

45 des ultra-sons, comme expose dans I'article "Current Approaches to DNA Sequencing" de J.C. Moores 
Analytic Biochemistry 163, 1-8 (1987). 

Etape b 

so Elle consiste a appliquer aux chaTnes obtenues en (a) quatre series de reactions chimiques specifiques 
des quatre bases de I'ADN. Ces reactions conduisent a I'obtention de quatre families de chaTnes d'ADN 
dont I'une des extremes est communement fixee et l'autre est constituee d'une base specifique de Tune 
des quatre series de reaction. 

Deux methodes sont communement utilisees pour obtenir les 4 families de chaTnes d'ADN ci-dessus. 

55 L'une, developee par Maxam et Gilbert (Maxam A.M. et Gilbert W. f Proc. Natl. Acad. Sci.. U.S.A., vol 74, 
N* 2, pp 560-564 de 1977, "A new method for sequencing DNA") fait appel a une procedure d 
degradation chimique des chaTnes t l'autre, introduite par Sanger (Sanger F. et al., Proc. Natl. Acad. Sci. 
USA 74, pp. 5453-5467 de Decembre 1977 "DNA sequencing with chain-terminating inhibitors") st une 
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methode nzymatique et emploie un precede de terminaison de chaTnes didesoxy. 

Dans la methode de Sanger, chacune des quatre reactions de sequengage met en jeu un grand 
nombre d'exemplaires d'ADN monocatenaire a sequencer ; un amorceur (ou en terminologie anglo-saxonne 
prim r) qui est un acide-nucleique complementaire de I'une des extremites de I'ADN a sequencer ; les 

5 quatre nucleotides dXTP ; un enzyme qui permet la fabrication du brin compl6mentaire de I'ADN a 
sequencer, a partir des nucleotides et en commengant par I'amorceur et enfin un seul des quatre di-desoxy 
nucleotides appeie nucleotide terminal et note ddXTP. Ce ddXTP est un nucleotide auquel il manque le 
groupement OH du carbone 3' du desoxyribose. 

L'amorceur se lie a I'ADN a sequencer par compiementarite puis 1'enzyme synthetise le brin comple- 

io mentaire jusqu'a ce qu'elle incorpore le ddXTP arretant ('elongation de la chaTne. L'incorporation du 
nucleotide terminal peut se produire n'importe quand au cours de la synthese ce qui se traduit, a la fin de 
I'operation de sequengage specifique d'une base X donnee, par la presence d'une famille d'ADN 
representant toutes les longueurs possibles depuis l'amorceur jusqu'a environ 400 nucleotides. 

Appliquee en parallele pour les quatre ddXTP, la serie de quatre reactions conduit a un ensemble de 

is quatre families de chaTnes d'ADN ; les chaTnes de chaque famille etant representatives d'une base X 
donnee sont ensuite deposees sur un gel d'eiectrophorese. 

Dans la methode de Maxam et Gilbert, des chaTnes d'ADN de dimensions adaptees et analogues a 
celles issues du procede de Sanger sont produites par un traitement chimique d'ADN purifie. Cette 
operation permet de sequencer un ADN mono- ou bicatenaire marque avec un phosphate radioactif a Tune 

20 de ses extremites. 

Pour chacune des quatre series de reaction de sequengage, I'ADN est soumis a un jeu de deux 
reactions chimiques. la premiere reaction chimique modifie et retire la base de son sucre, la seconde coupe 
I'ADN en retirant le sucre ainsi expose. On obtient ainsi des chaTnes commengant a un endroit fixe et se 
terminant par une base connue. Les conditions de reaction sont ajustees de fagon a produire des chaTnes 
25 de toutes les longueurs possibles comportant typiquement de 1 a 400 nucleotides. 

. Etape c 

Les chaTnes obtenues en (b) sont marquees prealablement, ou au cours des reactions, avec des 
30 marqueurs radioactifs. Les marqueurs radioactifs utilises sont le 32 P ou le 35 S, le tritium, le U C qui sont des 
emetteurs de rayonnements 0-. 

Dans le cadre de la methode de Sanger, il est possible de marquer I'amorceur, les dXTP ou les ddXTP. 

Etape d 

35 

Les chaTnes d'ADN marquees sont alors separees suivant leur longueur par eiectrophorese, les plus 
petites migrant le plus vite et les plus grandes le plus lentement. Le gel d'eiectrophorese qui est en general 
un gel de polyacrylamide permet de differencier les molecules de longueur N et N + 1 avec N variant de 1 
a 400 environ. 

40 L'eiectrophorese dure de 4 a 12 heures suivant la longueur du gel qui est ensuite seche. 
Etape e 

Le gel est ensuite place contre un film sensible au rayonnement beta. Les marqueurs radioactifs 
45 incorpores dans les chaTnes d'ADN sont utilises pour developper une image auto-radiographique de chaque 
trace eiectrophoretique. L'auto-radiographie est developpee apres 12 heures ou plus d'exposition au 
rayonnement. 

La position relative des bandes qui apparaissent sur I'image auto-radiographique, au sein des quatre 
colonnes correspondant aux quatre families de reactions, permet la determination de la sequence des 
so bases de I'ADN de depart. 

Apres la lecture, Texamen et 1'interpretation de l'auto-radiographie, la sequence est entree dans la 
memoire d'un ordinateur pour une analyse et un assemblage ulterieurs. 

Ces deux methodes de sequengage d'ADN precedemment decrites sont largement utilisees et 
comportent chacune plusieurs variantes. Bien que tres performantes et efficaces, ces methodes demandent 
55 une mise en oeuvre tres complexe qui comporte de serieux inconvenients. C'est en reaftte un tres gros 
travail, deiicat, qui doit etre extremement bien standardise pour que la source de connaissances et la 
comparaison des migrations eiectrophoretiques soient fiables. 
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Par ailleurs, la lecture des electrophoreses des chaTnes radioactives se fait apres auto-radiographie. La 
ausst, une parfaite reproductibilite est de rigueur tant dans le developpement de ces auto-radiogrammes 
qu dans leur lecture. 

En ff t, I'image sur film d'une bande de gel radioactif st plus large que la bande elle-meme t la 
5 comparaison des positions des band s entre les quatre pistes diffe>entes de I'electrophorese (qui peuv nt 
induire un comportement non uniforme quant aux mobilites des chaTnes) peut limiter la resolution 
effectivement observed sur Pauto- radiogram me et done require la longueur de la sequence qui peut etre lue 
a partir des gels. Typiquement, de 200 a 400 bases peuvent etre lues a partir d'un simple jeu de traces. 
De plus, les irregularites survenant d'un trace a un autre peuvent rendre difficile la lecture automatique 
10 des auto-radiogrammes par des techniques d'imagerie existantes (par exemple densitometres a balayages) 
car Poeil humain peut actuellement mieux discriminer ces irregularites que ne le font les ordinateurs. 

La n^cessite* d'un soin intensif quant a I'analyse "manuelle" des auto-radiogrammes demande done du 
temps et est sujette a des erreurs. 

Par ailleurs, Putilisation de marqueurs radioactifs pr^sente de s^rieux inconv^nients quant a la 
75 manipulation (systeme de protection comptexe des operateurs et decontamination periodique des installa- 
tions), au stockage des produits durant ('analyse et au stockage des dechets en fin d'analyse. 

Enfin, il n'est pas possible d'observer les bandes au sein du gel pendant I'electrophorese afin de 
controler Tope ration en cours, mais il faut necessairement terminer I'electrophorese a un moment determi- 
ne et attendre le developpement de Pauto-radiogramme avant de pouvoir lire la sequence. 
20 Aussi, plusieurs procedes ont deja envisage la detection en temps reel des chaTnes d'ADN pendant leur 
migration au cours de I'electrophorese. 

Les uns sMnteVessent par exemple a la detection du rayonnement /?- emis par les chaTnes marquees au 
32 P, les autres s'inte>essent a la detection de remission de fluorescence induite par un faisceau laser. 

Dans le premier cas, la detection en ligne (ou temps reel) des bandes radioactives au cours de 
25 I'electrophorese peut permettre une certaine simplification, par une certaine reduction du nombre des 
operations a effectuer, pour ('ensemble du procede. Cependant, il faut tenir compte de la courte periode de 
demi-vie du phosphore 32 et par consequent de Pinstabilite des reactifs de marquage radioactif. En outre, 
comme dans les methodes plus traditionnelles de Sanger ou Maxam et Gilbert, il demeure que des 
problemes sont poses par ('elimination et la manipulation des produits radioactifs. 
30 En outre, le temps de passage des chaTnes devant le detecteur etant tres reduit, cela implique une plus 
faible efficacite de collection des rayonnements, ce qui peut entraTner des problemes de sensibilite et de 
resolution. 

La detection de remission de fluorescence induite par un faisceau laser a ete proposee par Ansorge 
(voir DE-A-3 618 605 et I'article Journal of Biochemical and Biophysical Methods. 13(1986), pp 315-323, "A 
35 non-radioactif automated method for DNA sequence determination"). Cette methode utilise un seul fluoro- 
phore pour marquer Pamorceur (ou primer) dans le cadre de la methode de Sanger. 

Dans ce cas, les quatre series de reactions de s£quengage conduisent, comme decrit precedemment, 
a quatre families de chaTnes d'ADN deposees sur quatre pistes paralleles d'un gel d'electrophorese, qui est 
traverse entierement, suivant sa largeur, par un faisceau laser. Au sein du gel, les chaTnes d'ADN marquees 
40 sont excitees les unes apres les autres, dans Tordre de la sequence, lorsqu'elles passent dans le faisceau 
laser, au cours de I'electrophorese. 

Pour chaque piste d'electrophorese associee a une famille de reactions donnee, la lumiere de 
fluorescence est collectee par une optique adaptee et conduite, apres filtrage, a un detecteur de type 
photomultiplicateur. 

45 Un avantage offert par cette technique est I'absence de toute partie mobile au sein de I'appareil de 
detection grace aux detecteurs fixes qui permettent une detection continue sur les quatre pistes d'electro- 
phorese. 

Toutefois, Putilisation d'un seul fluorophore conduit inevitablement a Putilisation de quatre pistes en 
parallele, sur le gel d'electrophorese, pour retude d'une seule sequence, ce qui limite les possibilites 
so devolution sensible et de simplification ulterieures. II en est de meme lors de la detection en temps reel 
des chaTnes d'ADN marquees par du phosphore 32. 

Ces systemes de detection en temps reel necessitent aussi une grande fiabilite quant a la comparaison 
des mobilites eiectrophoretiques d'une piste a ('autre. Or, en pratique, plusieurs difficultes peuvent etre 
rencontrees ; en particulier, (a formation de gradient thermique et la presence d'impuretes au sein du gel 
55 peuvent induire des distorsions locales des chaTnes au sein du gel, et par suite compromettre directement 
Pattribution des bases dans la sequence cherchee. 

D'autres procedes de detection en temps reel proposent ('utilisation de plusieurs fluorophores afin 
d'identifier individuellement chaque famille de chaTnes. Ce typ de procede presente Pavantage, dans son 
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concept, d'offrir la possibilite de separer des chaTnes d'ADN issues des reactions de sequengag , sur une 
seule et meme piste d'eiectrophorese. Ces system s utilisent une serie de quatre fluorophores, ce qui 
semble r^pondre aux divers problemes soulignes prec^demment. Toutefois, la mise en oeuvre specifique 
de chacun de ces systemes ne r nd ces approches que partiellement reussies. 
5 Un premier systeme a ete propose* par L.M. Smith t al. (voir FR-A-2 558 262), dans le cadre des 

reactions de sequengage de Sanger. Dans cette technique, les reactions de sequengage doivent s'effectuer 
dans quatre tubes s6par6s, chacun comprenant un marqueur fluorescent different lie au "primer". L'appareil 
de detection d^crit par Smith et al. utilise une se>ie de filtres interfe>entiels a bande etroite afin de 
selectionner les longueurs d f onde specifiques d'emission de chacun des fluorophores. 
w A partir de ce precede* relativement simple, le type de systeme qui en nSsulte comporte au demeurant 
certaines imperfections. En particulier, de serieux problemes sont engendres par ('utilisation de molecules 
fluorescentes de charges et de tailles tres differentes. 

Cette situation se traduit par Texistence de perturbations au cours de I'electrophorese dues aux 
differences de mobiles eiectrophoretiques des diverses chaTnes marquees diff^remment. En effet, malgre 
15 Telaboration conjointe d'un logiciel lourd et assez complexe de traitement et de correction des donnees, 
ces phenomenes peuvent entraTner certains recouvrements voire des inversions de chaTnes au cours de 
I'electrophorese, empechant ou meme faussant Identification de certaines bases le long de la sequence. 

Par ailleurs, cette technique requiert obligatoirement I'utiiisation de quatre "primers** specifiques 
marques. Ceci entraTne, dans les cas ou d'autres vecteurs sont employes, la necessity d'entreprendre des 
20 processus longs et complexes de synthese et de purification de quatre nouveaux "primers"* fluorescents. 

Un second systeme propose par J.M. Prober et al. (voir EP-A-0 252 683) repose, toujours dans le cadre 
des reactions Sanger, sur ("utilisation de quatre fluorophores lies aux quatre ddXTP. Ce marquage different 
des ddXTP procure un certain nombre d'avantages. En particulier, les quatre reactions de sequengage 
peuvent s'effectuer dans un meme tube, un amorceur unique non marque peut alors etre utilise et les 
25 produits de reaction peuvent etre separes au sein d'une meme colonne d'electrophorese. 

Cependant, le fait de greffer au ddXTP des marqueurs extrinseques, c'est-a-dire les fluorophores, qui 
sont des molecules assez complexes et tres volumineuses, peut entraTner des decalages imprevisibles 
dans les mobilites de certaines chaTnes au cours de I'electrophorese et surtout restreindre fortement le 
choix d'enzymes de complementarite ; ceci elimine la possibilite d'utilisation des enzymes courantes 
30 comme amorceur, comme par exemple le fragment de Klenow d'ADN polymerase. Les fluorophores utilises 
sont generalement les derives de la fluoresceine. 

Par ailleurs, il est connu du document WO 89/12 694 opposable selon Particle 54(3) CBE. I'utiiisation 
d'isotopes stables du carbone, du soufre, du chlore et du brome pour le marquage des chaTnes de 
nucleotides de tailles differentes, la separation et Tionisation de ces chaTnes par electrophorese, ainsi que la 
35 detection des ions formes par spectrometrie de masse. 

"-'invention a done pour objet un procede d'identification des sequences d'un ADN permettant de 
remedier a la plupart des inconvenients donnes precedemment. Des problemes similaires apparaissant 
dans le sequengage de tout autre acide nucteique et, en particulier, dans les ARN, I'invention s'applique 
aussi a toute autre molecule complexe a structure repetitive (proteine ou peptide). 
40 ".'invention a pour objet un procede d'identification de la sequence des bases d'un acide nucleique, 
caracterise en ce ou"il comprend les etapes suivantes : 

A) - production de fragments de I'acide nucieique, 

B) - reactions chimiques specifiques des bases pour former des families de chaTnes de taille differente, 
chaque famille comportant a une extremite une base specifique, 

45 C) - marquage specifique desdites families de chaTnes et marquage de chaque nucleotide de chaque 
chaTne a I'aide d'isotopes stables ou de petites molecules stables directement greffables sur les 
nucleotides desdites chaTnes. 

D) - introduction une k une des chaTnes marquees dans des moyens d'atomisation et d'ionisation, 

E) - atomisation et ionisation de chaque chaTne marquee a Paide desdits moyens, 

so F) - selection et detection en temps reel des ions formes au fur et a mesure de leur formation, par 
spectrometrie de masse, et 

G) -traitement des signaux issus de la spectrometrie de masse, pour determiner la longueur de chaque 
chaTne en comptant le nombre de nucleotides marques de chaque ion detecte et pour identifier le 
marquage specifique de chaque famille de chaTnes. 
55 Le fonctionnement en temps reel est lie au fait que, dans I'invention, les ions sont detectes au fur et a 
mesure de leur formation. 

L'ionisation des chaTnes marquees puis la detection de ces chaTnes par un spectrometre ou analys ur 
de masse facilite considerablement la detection des chaTnes marquees et done ("identification des bases de 
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I'acide nucleique. 

Le procede selon I'invention s'applique parfaitement bien au sequengage de I'ADN. 

Ce procede de sequengage fonctionne en continu et ne comporte pas d'etape de radiographie ni 
d'electrophorese selon Tart anterieur. En outre, les chatnes de nucleotides marquees sont examinees et 
5 analysers une par un et non globalement selon I 'art anterieur. 

Selon Tinvention, on effectue un marquage de tous les nucleotides de chaque chaTne ; la detection des 
marqueurs de chaque nucleotide donne ('information de la longueur de ces chaTnes alors que la detection 
du marquage specifique donne I'information de la famille de chaTnes. 

Enfin, I'ionisation et la spectrometrie de masse permettent I'utilisation de marqueurs lies de maniere 
w intrinseque ou extrinseque aux d iff e rents nucleotides, ce qui autorise ('application de ce procede aux 
diverses methodes chimiques de sequencage les plus repandues, et en particulier, celte de Sanger et de 
ses variantes. 

Le marquage specifique de chaque famille de chaTnes et/ou le marquage de tous les nucleotides de 
chaque chaTne sont effectu£s avec des isotopes ou des petites molecules stables. 
75 Par petites molecules, il faut comprendre des composes chimiques pouvant etre lies aux nucleotides et 
qui component au moins un element marqueur identifiable par spectrometrie de masse, tel que CF 2 , Si- 
(CH 3 ) 3 , en utilisant par exemple une technique decrite dans ('article Tetrahedron, vol. 26, N° 40, pp. 4915- 
4918 (1985), CD. Pein, D. Cech. 

Le procede selon I'invention, grace a I'utilisation de trois, quatre ou plusieurs isotopes ou petites 
20 molecules stables, c'est-a-dire npn radioactifs, done non dangereux pour les operateurs, facilite considera- 
blement les interventions humaines dans le procede d'identification. 

L'invention a aussi pour objet une installation pour I'identification des bases d'un acide nucleique 
comportant : 

- une source de families de chaTnes de bases de longueur differente, chaque famille de bases etant 
25 specifiquement marquee et les nucleotides de chaque chaTne etant marques, ces marquages etant 

faits avec des isotopes stables ou de petites molecules stables directement greffees sur les 
nucleotides desdites chaTnes, 

- des moyens pour introduire une a une dans des moyens d'atomisation les chaTnes marquees, 

- des moyens d'atomisation de chaque chaTne marquee, 

30 - des moyens d'ionisation des chaTnes individualists et atom i sees, 

- un spectrometre de masse equipe de plusieurs detecteurs pour selectionner et detecter les ions 
formes au fur et a mesure de leur formation, et 

- des moyens de traitement des signaux fournis par les detecteurs, pour determiner la longueur de 
chaque chaTne en comptant le nombre de nucleotides marques de chaque ion detecte et pour 

35 identifier le marquage specifique de chaque famille de chaTnes. 

Comme on I'a dit precedemment, I'invention s'applique a toute autre molecule complexe que I'ADN et 
TARN a structure repetitive. Aussi, I'invention a encore pour objet un procede d'identification des motifs 
d'une molecule organique complexe ou d'un fragment de cette molecule comportant les etapes suivantes : 

- marquage specifique desdits motifs par des isotopes stables ou petites molecules stables directement 
40 greffables sur lesdits motifs, 

- introduction un a un des motifs marques dans des moyens d'atomisation et d'ionisation, 

- atomisation et ionisation de chaque motif marque a I'aide desdits moyens, 

- detection en temps reel des ions formes au fur et a mesure de leur formation par spectrometrie de 
masse, et 

45 - traitement des signaux issus de la spectrometrie de masse pour determiner fa longueur de la 
molecule complexe ou du fragment de cette molecule en comptant le nombre de motifs marques et 
pour identifier leur marquage specifique. 
D'autres caracteristiques et avantages de I'invention ressortiront de la description qui suit, donnee a 
titre illustratif et non limitatif aux dessins annexes, dans lesquels : 
so - la figure 1 represente un schema d'ensemble des etapes de sequengage automatise d'ADN selon 
Tinvention, 

- la figure 2 represente un schema d'ensemble d'une installation automatisee pour le sequengage 
d'ADN conforme a I'invention, 

- la figure 3 represente le type de donnees produites par un sequengage d'ADN selon I'invention. 

55 La description qui va suivre se refere au sequengage de I'ADN, bien que comme on I'a dit 
precedemment, I'invention s'applique a tout acide nucleique (ARN par exemple) et meme a toute molecule 
organique complexe (proteine, peptide). 
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La premiere etape du procede, en referenc a la figure 1, consiste a fragmenter un genome d'ADN 
(6tape a), conformement a Tart anterieur cite\ Cette etape de fragmentation porte ia reference 2 sur la figure 
1. 

Les chatnes obtenues sont alors soumises aux reactions de sequengage (£tape b) selon les methodes 
5 de Sanger, si ce n'est que I'£chelle peut etre augmented en cas de besoin pour fournir un intensite* de 
signal adequate pour la detection de chaque famille de chaTnes. Aucun nucleotide radio marque" n'a besoin 
d'etre inclu dans les reactions de s£quengage. Les reactions de sequengage sont symbolisees par le bloc 
4 sur la figure 1 . 

Selon I'invention, tous les nucleotides incorpores selon Sanger au cours de la synthese des chaTnes 
10 nucl§otidiques complementaires du fragment d'ADN a sequencer sont marques ou bien comportent une 

caracteristique identifiable par spectromeVie de masse. En outre, un marquage specifique de chaque famille 

de chaTnes issue des reactions de s^quengage doit etre effectue\ 

Le marquage des chaTnes nucl^otidiques, symbolise par le bloc 6, peut etre realise en utilisant un 

isotope ou une combinaison d'isotopes stables, constituants eventuels de petites molecules stables, afin de 
75 marquer specif iquement chaque nucleotide de chaque chaTne ainsi que I'extremite de ces chaTnes en 

fonction de la base terminale de ces chaTnes. 

Le marquage specifique de la famille de chaTne peut etre realise sur I'amorceur, comme decrit dans le 

document FR-A-2 558 262, ou sur le didesoxy nucleotide, comme decrit dans le document EP-A-0 252 683, 

mais en utilisant des isotopes ou petites molecules stables. 
20 Grace a ce double systeme de marquage, chaque chaTne d'ADN issue des reactions chimiques de 

s^quencage comporte une double information : 1) la detection du nombre de marqueurs et done du 

nombre de nucleotides constituant chaque chaTne, qui donne I'information taille de la chaTne (comme le 

faisait ante>ieurement I'^lectrophorese -6tape d-), 2) la detection du marqueur stable specifique de la famille 

qui donne le type de nucleotide, et done de base, existant a Tune des extremites de la chaTne (comme le 
25 faisait anterieurement les fluorophores ou les isotopes radioactifs -etape c-). 

Le marquage isotopique selon I'invention des chaTnes d'ADN peut etre realise au niveau de Tun des 

trois composes chimiques constituant les nucleotides, c'est-&-dire la base, le sucre ou le groupement 

triphosphate ou eventuellement sur un groupement alpha-thiophosphatg dans lequel I'atome d'oxygene lie 

au premier phosphore est remplace par un atome de soufre. 
30 Le marquage des chaTnes peut §tre r£alis£ de fagon intrinseque sur le carbone, I'hydrogene, I'a20te. 

I'oxygene ou mime le soufre entrant dans la constitution des trois composes chimiques d'un nucleotide. 

L'utilisation d'isotopes naturels stables, selon ('invention, off re un choix plus important que les isotopes 

radioactifs g^neralement utilises ( 32 P, 35 S, 1 *C, 3 H) pouvant entrer dans la constitution des diffe>ents 

composes nucleotidiques. 

35 Une liste de ces isotopes stables, incluant leur abondance naturelle relative, est donnge dans le tableau 
1. 



Tableau 1 



Isotopes naturels stables pour marquage intrinseque des composes nucleotiques 


Isotopes 


Abondance relative (%) 


D 


0,015 


13 C 


1,10 


15 N 


0,37 


17 0 


0,038 


18Q 


0,20 


32 s 


95,02 


33 S 


0,75 


34 S 


4,21 


36 S 


0,02 



Du point de vue chimique, les reactions pour incorporer un isotope stable ou un isotope radioactif sont 
55 les memes. 

Les divers proc^des de marquage de molecules biologiques par des isotopes stables existent et sont 
largement repandus (voir a cet effet I'article "The preparation of purines, pyrimidines, nucleotides and 
related compounds labelled with 17 O and other stable isotopes", E. Petreanu, J.S. Cohen and D. Samuel, 
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Proceedings of the 2nd International Conference on methods of preparing and storing labelled compounds, 
pp. 489-497). DiffeVentes molecules marquees, en particulier les nucleotides peuvent etre produites par vote 
d synthese ou par voie enzymatique. En particulier, de nombreux composes nucleotidiqu s marques av c 
des isotopes stables sont disponibles sur le marche pour des applications en biologie et en pharmacologie 
diffe>entes de celles de I'invention (voir par exemple I'article Dehalogenation reactions in fast atom 
bombardment mass-spectrometry, Anal. Chem. 1984.56, 1975.77). 

Des exemples de nucleotides marques a Paide d'isotopes natureis sont donnas dans les annexes I et II. 

Ces exemples ont uniquement pour but d'illustrer des moyens de marquage possibles utilisables dans 
('invention. 

Comme donnees dans ces annexes I et II, le marquage peut etre effectue sur les formes desoxytriphos- 
phate (annexe I) ainsi que sur leurs analogues alpha-thiotriphosphate (annexe II) pour le marquage de 
chaque nucleotide et peut etre effectue" sur les formes did^soxytrrphosphate (annexe I) ainsi que sur leurs 
analogues alpha-thiotriphosphate (annexe II) pour le marquage specif ique de la famille. 

Comme autre nucleotide marque intrinsequement utilisable pour Pinformation de taille des chaTnes 
issues des reactions de Sanger, on peut citer le 1 ou 3- 15 NdATP, l'a- 18 OdCTP, le 4- 18 0dTTP, le 2- 13 CdATP 
ou dCTP, le 8- 13 CdATP, le 5'- 13 CdATP, I'a-SdATP, Pa-SdGTP, I'a-SdCTP, Pa-SdTTP ou S est I'isotope 32, 
34, 33 ou 36, le methyl 13 CdTTP. 

II est aussi possible, selon I'invention, d'effectuer un marquage extrinseque des nucleotides de chaque 
chaTne, des didesoxy nucleotides de ces chaTnes ou meme des amorceurs. Ce type de marquage 
comporte I'avantage de pouvoir lier au nucleotide des atomes (sous forme mono ou polyatomique) qui ne 
sont pas naturellement presents dans ces molecules. Ces marqueurs sont constitues d'eiements ou de 
petits complexes moleculaires d'eiements alcalins, alcalino-terreux ou halogeniques. 

Dans le cadre des reactions de sequencage, le marquage extrinseque selon I'invention presente moins 
de risque de denaturer les proprietes physiques et chimiques des nucleotides, contrairement a I'adjonction 
selon Tart anterieur de grosses molecules telles que les chromophores ou fluorophores qui ne peuvent etre 
liees que par Pintermediaire de bras specifiques relativement complexes. Ainsi, les elements ou petits 
complexes moleculaires selon I'invention peuvent etre directement greffes au nucleotide en profitant des 
liaisons covalentes disponibles au sein de la base ou du sucre de chaque nucleotide (voir par exemple 
Particle d'Anal. Chem. cite en dernier). 

Des exemples de marquage extrinseques selon Pinvention sont donnes en annexe III. Cet exemple 
donne un jeu complet de bases nucieotidiques de PARN et ADN marquees extrinsequement. En particulier, 
X represente un atome de fluor, de chlore, de brome ou d'iode. 

Comme nucleotide marque par des halogenes utilisables dans Pinvention, on peut citer le 8-bromo 
dGTP, le 5-bromo dCTP, le 3'-bromo, chloro ou iodo dTTP, le 5-bromo iodo ou fluoro dTTP, le 3'-FdGTP. 

En tenant compte de Pexistence de plusieurs isotopes stables possibles des differents marqueurs 
extrinseques (elements halogenes par exemple), les possibilites de marquage isotopiques des nucleotides 
sont fortement accrues. 

Une liste des differents isotopes stables d'eiements halogenes est presentee dans le tableau 2, 
accompagnes de leur abondance naturelle relative. 



Tableau 2 



Isotopes natureis stables des elements halogenes pour le marquage extrinseque 


Isotopes 


Abondance relative (%) 


19 p 


100 


35 CI 


75,77 


37 CI 


24,23 


79 Br 


50,69 


81 Br 


49,31 


127 | 


100 



Conformement a Pinvention, il est possible d'effectuer des marquages multiples des nucleotides de 
chaque chatne issue des reactions de sequengage (information taille), des didesoxy nucleotides et 
amorceurs (information famille) de ces chaTnes, ces marquages etant des marquages intrinseques et/ou 
extrinseques. 
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En pr mier lieu, on peut citer des possibility d'incorporer plusieurs isotopes marqueurs de meme type 
sur un nucleotide donne. Comme nucleotide marque" de ce type, on peut citer par exemple le 1,3- 15 N 
dATP, I 1,3- 15 NdCTP, ie 2,8-dichloro ou dibromo ou difluoro dATP, le 5,5-dibromo dCTP. Ceci permet 
d'accroltr d'autant la s nsibilite obtenue lors de la detection et de I'identification des chaTnes nucleotidi- 
5 ques. 

En second lieu, plusieurs marqueurs differents peuvent etre incorpores au sein d'un meme nucleotide 
afin d'affiner sa signature. De plus, la detection simultan§e de plusieurs marqueurs augmente consideVable- 
ment les combinaisons de marquages possibles. 

L'exemple suivant montre que trois types de marqueurs isotopiques stables suffisent a I'identification 
to de quatre nucleotides differents : 

13 C seuL 

13 C + 17 0 

1 3 C + 15 N 

15 N + 17 0 



Nucleotide de type A 

G 
C 



Ainsi, les marquages intrinseques et extrinseques des nucleotides a I'aide d' isotopes stables peuvent 
20 etre combine's et offrent de replies possibilites multiples et varices. 

Cette methods de marquage s'avere plus souple et plus riche devolution que les marquages radio- 
isotopiques ou par fluorophores selon Tart anterieur qui restent force me nt plus limites dans leurs possibili- 
tes. De plus, la plupart des inconvgnients rencontres avec ces derniers lors de leur manipulation et de leur 
utilisation sont evit£s voire completement 6\\ mines. 
25 Les chaTnes d'ADN marquees sont alors placees dans une source d'echantillon 8 appropriee a leur 
introduction individuelle dans une source d'ions. Cette etape est realisee grace a la formation de 
microgoutteiettes contenant au plus une molecule marquee. 

Celles-ci sont ensuite introduites successivement une a une dans une source d'ions charged de 
I'atomisation et de Pionisation. Cette etape porte la reference 10 sur la figure 1 et correspond a I'etape D et 
30 E. 

Les ions formes pour chaque chaTne marquee sont alors selectionnes puis detectes par spectrom£trie 
de masse, comme indique en 12, et les signaux issus de la spectrome'trie de masse sont traites, comme 
indiqu§ en 14 en vue de reconstituer I'ADN de depart (etape G). 

L'installation permettant le sequengage automatise de I'ADN, conformement a ('invention, est schemati- 
35 s6e sur la figure 2. La fragmentation du genome, les reactions chimiques de sequengage et le marquage 
etant effectues de fagon discrete ou de fagon independante dans le temps, ne sont pas represented sur la 
figure 7. 

^installation representee comporte une source 18 de chaTnes marquees d'ADN a I'aide d'isotopes 
stables selon I'invention, placee sous pression et contenant une cuve 20 destinee a recevoir I'echantillon 22 
40 des chaTnes marquees d'ADN diluees a environ 10~ 10 mole/I dans une solution tampon. 

Un tube capillaire 24 d'environ une dizaine de micron de diametre plongeant dans I'echantillon 22 
assure I'introduction une a une des chaTnes d'ADN marquees dans une source d'ions 26. Le cristal 
piezoeMectrique 28 permet le fractionnement homogene la nebulisation en microgoutteiettes de quelques 
micrometres de diametre de I'affluent du tube 24. 
45 Elles sont alors introduites une a une dans la source a plasma 32 6quipee de bobines 4lectromagn6ti- 
ques 33 reliees a un generateur radiofrequence 34. Dans la zone 32a la plus chaude du plasma, ou la 
temperature atteint 6727 a 7727 • C (7000 a 8000 ' K), les molecules d'ADN sont atomisers et ionisees. 

La torche a plasma est la source preferee d'ionisation selon ('invention car elle permet I'atomisation 
complete des molecules et induit une simplicity maximale dans le spectre de masse obtenu apres analyse 
so d 'elements simples. 

Les ions formes sont alors pris en charge par I'optique d'entr^e 36 d'un spectrometre de masse 38 qui 
peut etre du type a secteur magn£tique ou un vide differentiel s'installe grace a des pompes primaires et 
secondares 39 ; la pression au niveau de I'optique ionique 36 est de I'ordre de 10~ 4 torr (10" 2 Pa) et la 
pression au niveau des pieces polaires 40 du spectrometre est de I'ordre de 10~ 6 torr (10~ 4 Pa). 
55 Le premier role du spectrometre de masse 38 est de selectionner et d'identifier grace a son optique 
ionique 36 et ses pieces polaires 40, la presence des masses specifiques obtenues grace au traceur 
isotopique utilise precedemment. L spectrometre de mass 38 peut operer en mode s£l ctif ce qui 
consiste a balayer uniquement les masses caracteVistiqu s dues a la presence du marqueur isotopique, afin 
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de fournir un maximum de sensibility. 

La detection par spectrometrie de masse permet a la fois de detecter les chaTnes d'ADN marquees au 
fur et a mesure de leur sortie de la source d fragments 18, d'tdentifier, grac a leurs marqueurs 
specifiques, a quelle famille elles corr spondent ainsi que de determiner leur taiile grace au comptage du 
nombre de nucleotides. 

Les molecules ionisees et selectionne*es par le spectrometre de masse sont alors detectees a I'aide 
d'une s^rie de detecteurs 42 situSs a la sortie du spectrometre 38, du type multiplicateur d'eiectrons et qui 
sont sensibles a I'impact d'un seul ion. Les ions sSlectionnes peuvent done etre detectes individuellement, 
ce qui favorise I'obtention d'une sensibilite maximale de ('installation totale de sequencage. 

Le signal de comptage fourni par chaque detecteur 42 est alors recu dans un micro-ordinateur 46 du 
type PC qui gere automatiquement, a la fois le pilotage des divers sous-ensembles (18, 26, 38) de 
('installation, le traitement et la representation des donn6es. 

Pour chaque chaTne marquee, I'evenement correspondant a son identification par spectrometrie de 
masse est caracte>ise* par la detection simultanee : 1) d'un marqueur caracteYisant la famille de la chaTne, 2) 
d'un certain nombre d'autres marqueurs associes a chaque nucleotide de la chaTne. Ce nombre est 
directement relie a la quantite de nucleotides constituant la chaTne, done a sa longueur (autant de 
marqueurs que de nucleotides par exemple). 

Au bout d'un certain temps, de nombreuses chaTnes sont passies une a une dans I'ensemble de 
detection. Une statistique est alors constitute afin d'etablir des diagrammes tels que represented sur la 
figure 3. Les diagrammes de la figure 3 correspondent a I'ADN hypothetique TGACTGCACGTA. 

Le nombre d'evenements associes a la presence d'un marqueur specifique stable d'une famille (sur le 
didesoxy par exemple) est porte en ordonnee : isotope 1 pour les chaTnes terminees par I'adenine (famille 
A) ; isotope 2 pour les chaTnes terminees par la guanine (famille G) ; isotope 3 pour les chaTnes terminees 
par la cytosine (famille C) et isotope 4 pour les chaTnes terminees par la thymine (famille T). L'unite des 
ordonnees est arbitraire. 

Le nombre de marqueurs stables associes aux nucleotides et detectes simultanement lors des 
evenements est porte en abscisse. Ce nombre est directement relie (voire proportionnel) au nombre de 
nucleotides (n, n + 1, n + 2... avec n variant de 1 a 400 environ) constituant les chaTnes detectees dans 
I'ensemble du systeme de detection. 

Les diagrammes etablis pour les quatre types de families donnent alors les informations necessaires 
pour determiner Tensemble de la sequence de I'ADN de depart. 

A titre illustratif, on donne, ci-apres, trois exemples de marquage des differentes chaTnes de I'ADN 
hypothetique TGACTGCAACGTA. 

Au cours des reactions de sequencage selon Sanger, tous les nucleotides libres presents (desoxy et 
didesoxy) sont marques. Leur incorporation dans les bras synthetises engendrent des chaTnes de la forme: 




j— I— i— i— i— i— i— i— i— i— i— i— | 

>- y f 



desoxy nucleotides marques (X) 
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EXEMPLE 1 



desoxy nucleotides marques marques au 13 C : 


didesoxy nucleotides marques specifiquement : 


2 - 13 C dATP 


2,8 dichloro ddATP pCI) 


8- 13 C dGTP 


5,5 dibromo ddCTP ( 79 Br) 


2- 13 CdCTP 


8,3' difluoro ddGTP ( 19 F) 


methyl 13 C dTTP 


5,3' diiodo ddTTP ( 127 l) 


Chalnes marauees 




T 6 A C T 6 

1 1 1 1 1 N 19 F 


T G A C T 

I I I I Xl27 I 


13 C 13 C 13 C 13 c 13 c 


13 C 13 C 13 C 13 C 



TGACT6CA 



13 C 13 C 13 C 13 C 13 C 13 C 13 c 
T G A C T G C 




13 C 13 C 13 C 13 C 13 C 13 C 
EXEMPLE 2 



desoxy nucleotides marques au 32 S 


didesoxy nucleotides marques specifiquement 


a dATP 


1,3 15 N ddATP 


a 32 S dGTP 


2,4 13 C ddCTP 


a dCTP 


2,4 18 0 ddTTP 


a 32S dTTP 


a,a 17 O ddGTP 
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Exemples de cha^nes marquees 

T G A C T G 

I I I I I ti 
32 s 32 S 32 S 32 S 32 s 



18 0 



32 S 32 S 32 S 32 S 



10 



15 



I I 

32 s 32 s 32 s 32 s 32 s 32 s 32 s 

T G A C T G C 



\ 

* 15 N 



I I I I I I 
32 s 32 s 32 S 32 S 32 s 32 s 



13, 



20 



25 



30 



EXEMPLE 3 



desoxy nucleotides marques au 79 Br 


didesoxy nucleotides marques sp^cifiquement : 


8 bromo dATP 


cr- 32 S ddATP 


8 bromo dGTP 


a- 33 S ddGTP 


5 bromo dCTP 


a- 34 SddCTP 


5 bromo dTTP 


a- 36 SddTTP 



Cha!nes marquees 



? 9 Br 79 Br 79 Br 79 Br 79 Br 



33< 



40 



I I I I 

79 Br 79 Br 79 8r 79 Br 

T G A C 



? 9 Br 79 Br 79 Br 
T G A 



36. 



79 Br 79 Br 79 Br 79 Br 



79 Br 79 Br 79 Br 79 Br 79 Bl 



G 
I 

79 Br 



(.'invention ayant ete decrite en detail, il est evident que TARN ou d'autres types de molecules 
organiques compl xes organiques peuvent §tre analysees grace au proc<§de et a Installation selon 
['invention. 
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Par exemple en marquant chacun des acides amines d'une proteine et plus specifiquement certains 
d'entre eux, il est possible, grace a I'invention de compter le nombre d'atomes marqueurs et d'en deduire 
I nombre decides amines de la proteine ainsi que le nombre d s acides amines qui avaient ete marques 
specifiquement. En renouvelant cette operation pour tous les types d'acides amines, on peut determiner la 
5 composition n acides amines de la proline. 

De meme fagon, il est possible de determiner la longueur des fragments de restriction d f ADN et d'ARN 
en comptant le nombre de marqueurs, celui-ci e*tant £gal au nombre de nucleotides desdits fragments. 

x 



75 



20 



25 



35 



40 



45 




© 



50 



55 
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ANNEXE III 



NH, 
I 2 




H 

GUANINE CYTOSINE 



Revendications 

1. Procede d'identification de la sequence des bases d'un acide nucleique, caracterise en ce qu'il 
comprend les Stapes suivantes : 

A) - production (2) de fragments de Pacide nucleique, 

B) - reactions chirniques sp^cifiques (4) des bases pour former des families de chaTnes de taille 
differente, chaque famille comportant a une extremite une base specifique, 

C) - marquage specifique (6) desdites families de chaTnes et marquage de chaque nucleotide de 
chaque chaTne a Taide d'isotopes stables ou de petites molecules stables directement greffables sur 
les nucleotides desdites chaTnes. 

D) - introduction (8) une a une des chaTnes marquees dans des moyens d'atomisation et d'ionisation 
(26, 28, 30, 32), 

E) - atomisation et ionisation (10) de chaque chaTne marquee a I'aide desdits moyens, 
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F) - selection et detection (12) en temps reel des ions formes au fur et a mesure de leur formation, 
par spectrometrie de masse, et 

G) -traitement (14) des signaux issus de la spectrometrie de masse, pour determiner la longueur de 
chaque chaTne en comptant le nombre de nucleotides marque's de chaque ion de*tecte et pour 

5 identifier le marquage specifique de chaque famille d chaTnes. 

2. Procede selon la revendication 1 t caracte>is6 en ce que le marquage est realise" de fagon intrinseque 
avec au moins un isotope choisi parmi D, 13 C, 15 N, 17 O, 18 O, ^S, 33 S, 34 S, et 36 S. 

w 3. Procede selon la revendication 1 ou 2, caracterise en ce que le marquage est realise" de fagon 
extrinseque avec au moins un isotope choisi parmi 19 F, 35 CI, 37 CI, 7 9 Br, 81 Br et 127 1. 

4. Procede selon Tune quelconque des revendications 1 a 3, caracterise* en ce que Tacide nucleique est 
PADN. 

75 

5. Procede selon Tune quelconque des revendications 1 a 4, caracteris£ en ce que Tetape B) consiste a 
synthetiser une chaTne de nucleotides compiementaire d'un fragment dudit acide nucleique a partir 
d'un amorgeur jusqu'a ce qu'elle incorpore un didesoxynucleotide. 

20 6. Procede selon la revendication 5, caracterise en ce que le marquage est effectue sur un element choisi 
parmi la base, le sucre et le triphosphate du didesoxynucleotide et I'amorgeur. 

7. Procede selon la revendication 5 ou 6, caracterise en ce que chaque nucleotide incorpore au cours de 
la synthese de chaque chaTne est marque. 

25 

8. Installation pour la mise en oeuvre du procede selon Tune quelconque des revendications 1 a 7, 
caracterisee en ce qu'elle comporte : 

- une source (18) de families de chaTnes de bases de longueur differente, chaque famille de bases 
etant specif iquement marquee et les nucleotides de chaque chaTne etant marques, ces marqua- 

30 ges etant faits avec des isotopes stables ou de petites molecules stables directement greffees 

sur les nucleotides desdites chaTnes, 

- des moyens (22, 24) pour introduire une a une dans des moyens d'atomisation les chaTnes 
marquees, 

- des moyens (26, 28, 30) d'atomisation de chaque chaTne marquee, 

35 - des moyens (32) d'ionisation des chaTnes individualisees et atomisees, 

- un spectrometre de masse (38) equipe de plusieurs detecteurs (42) pour seiectionner et detecter 
les ions formes au fur et a mesure de leur formation, et 

- des moyens (46) de traitement des signaux fournis par les detecteurs (42), pour determiner la 
longueur de chaque chaTne en comptant le nombre de nucleotides marques de chaque ion 

40 detecte et pour identifier le marquage specifique de chaque famille de chaTnes. 

9. Installation selon la revendication 8, caracterisee en ce que les moyens d'ionisation comportent une 
torche a plasma (32). 

45 10. Procede d'identification des motifs d'une molecule organique complexe a structure repetitive ou d'un 
fragment de cette molecule, comportant les etapes suivantes : 

- marquage specifique (6) desdits motifs par des isotopes stables ou petites molecules stables 
directement greffables sur lesdits motifs, 

- introduction (8) un a un des motifs marques dans des moyens d'atomisation et d'ionisation (26, 
so 28, 30, 32), 

- atomisation et ionisation (10) de chaque motif marque a Taide desdits moyens, 

- detection (12) en temps reel des ions formes au fur et a mesure de leur formation par 
spectrometrie de masse, et 

- traitement (14) des signaux issus de la spectrometrie de masse pour determiner la longueur de la 
55 molecule complexe ou du fragment de cette molecule en comptant le nombre de motifs marques 

et pour identifier leur marquage specifique. 
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Claims 

1. Method for identifying the s quence of the bases of a nucleic acid, characterized in that it essentially 
compris s the following stages: 

A) production (2) of fragments of the nucleic acid, 

B) specific chemical reactions (4) of bases so as to form chains of families of different sizes, each 
family comprising at each extremity a specific base, 

C) specific labelling (6) of said families of chains and labelling of each nucleotide of each chain with 
stable isotopes stable small molecules directly graftable onto the nucleotides of said chains, 

D) introducing (8) one at a time labelled chains into atomizing and ionizing means (26, 28, 30, 32), 

E) atomizing and ionizing (10) of each labelled chain by means of said means, 

F) real time selecting and detecting (12) of ions formed as they form, by mass spectrometry and, 

G) processing (14) signals derived from the mass spectrometer so as to determine the length of 
each chain by counting the number of labelled nucleotides of each ion detected and so as to identify 
the specific labelling of each family of chains. 

2. Method according to claim 1 , characterized in that labelling is intrinsically carried out with at least one 
isotope selected from D, 13 C, 15 N, 17 0, 18 0, 32 S, ^S, and ^S. 

3. Method according to claim 1 or 2, characterized in that labelling is extrinsically carried out with at least 
one isotope selected from 19 F, 35 CI, 37 CI, 79 Br. 81 Br and 127 l. 

4. Method according to any one of the claims 1 to 3, characterized in that the nucleic acid is DNA. 

5. Method according to any one of the claims 1 to 4, characterized in that stage B) consists of 
synthesizing a complementary chain of nucleotides with a fragment of said nucleic acid from a primer 
until it incorporates a dideoxynucleotide. 

6. Method according to claim 5, characterized in that labelling is carried out on an element selected from 
the base, sugar and triphosphate of the dideoxynucleotide and the primer. 

7. Method according to claim 5 or 6, characterized in that each nucleotide incorporated during the 
synthesis of each chain is labelled. 

8. Installation for performing the method according to any one of the claims 1 to 7, characterized in that it 
comprises: 

- a source (18) of families of chains of bases of different length, each family of bases being 
specifically labelled and the nucleotides of each chain being labelled, these labellings being 
performed with stable isotopes or stable small molecules directly grafted onto the nucleotides of 
said chains, 

- means (22, 24) for introducing the labelled chains one at a time into the atomization means, 

- means (26, 28, 30) for atomizing each labelled chain, 

- means (32) for ionizing individualized and atomized chains, 

- a mass spectrometer (38) equipped with several detectors (42) for selecting and detecting the 
ions formed as they form and 

- means (46) for processing signals supplied by the detectors (42) so as to determine the length of 
each chain by counting the number of labelled nucleotides of each ion detected and so as to 
identify the specific labelling of each family of chains. 

9. Installation according to claim 8, characterized in that the ionization means comprises a plasma torch 
(32). 

10. Method for identifying the units of a complex organic molecule with a repetitive structure or a fragment 
of this, molecule, comprising the following stages: 

- specific labelling (6) of said units by stable isotopes or stable small molecules directly graftable 
onto said units, 

- introducing (18) one at a time the labelled units into the atomization and ionization means (26 28 
30, 32), ' ' 
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- atomizing and ionizing (10) of ach labell d unit using said means, 

- detecting (12) in reat time the ions formed, as they form, by mass spectrometry, and 

- processing (14) signals derived from the mass spectrometer so as to determine the length of the 
complex molecule or fragment thereof by counting the number of labelled units and so as to 
identify their specific labelling. 

PatentansprLiche 

1. Verfahren zur Identifikation der Sequenz von Nukleinsaurebasen, dadurch gekennzeichnet, daB es die 
folgenden Abschnitte umfaBt: 

A) - Herstellung (2) von Nukleinsaurefragmenten, 

B) - spezifische chemische Reaktionen (4) von Basen, um Familien von Ketten verschiedener GroBe 
zu bilden, wobei jede Familie an einem Ende eine spezifische Base umfaBt, 

C) - spezifische Markierung (6) der besagten Familien von Ketten und Markierung jedes Nukleotids 
jeder Kette mithilfe von stabilen Isotopen oder kleinen, direkt auf die Nukleotide der besagten Ketten 
implantierten stabilen Molekulen, 

D) - EinfOhrung (8) der markierten Ketten nacheinander in die Gerate zur Zerstaubung und 
lonisierung (26, 28, 30, 32), 

E) - Zerstaubung und lonisierung (1 0) jeder markierten Kette mithilfe der besagten Gerate, 

F) - Selektion und Detektion (12) der gebildeten lonen in Echtzeit je nach ihrer Bildung durch 
Massenspektrometrie, und 

G) - Verarbeitung (14) der vom Massenspektrometer ausgegebenen Signale, um die Lange jeder 
Kette zu bestimmen, indem man die Anzahl der markierten Nukleotide jedes detektierten Ions zahlt 
und um die spezifische Markierung jeder Familie der Ketten zu identifizieren. 

2. Verfahren gemaB Anspruch 1 , dadurch gekennzeichnet, daB die Markierung intrinsisch mit mindestens 
einem Isotop ausgefuhrt wird, das aus D, 13 C, 15 N, 17 O, 18 O, 32 S, 33 S, 3 *S und 36 S ausgewahlt wurde. 

3. Verfahren gemaB Anspruch 1 Oder 2, dadurch gekennzeichnet, daB die Markierung auBerlich mit 
mindestens einem Isotop ausgefuhrt wird, das aus 19 F, 35 CI, 37 CI, 79 Br, 81 Br und 127 1 ausgewahlt wurde. 

4. Verfahren gemaB einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daB die Nukleinsaure DNS 
ist. 

5. Verfahren gemSB einem der AnsprUche 1 bis 4, dadurch gekennzeichnet, daB der Abschnitt B) daraus 
besteht, eine zum Fragment der besagten Nukleinsaure komplementare Nukeotidkette zu synthetisie- 
ren, ausgehend von einem Initiator bis sie ein Bidesoxynukleotid eingebaut hat. 

6. Verfahren gemaB Anspruch 5, dadurch gekennzeichnet, daB die Markierung auf einem Element 
ausgefOhrt wird, das aus der Base, dem Zucker und dem Bidesoxynukleotidtriphophat und dem Initiator 
ausgewahlt wird. 

7. Verfahren gemaB Anspruch 5 oder 6, dadurch gekennzeichnet, daB jedes im Laufe der Synthese von 
jeder Kette eingebaute Nukleotid markiert ist. 

a Ausrustung fur den Einsatz des Verfahrens gemaB einem der Anspruche 1 bis 7, dadurch gekennzeich- 
net daB sie 

- eine Quelle (18) von Familien von Basenketten verschiedener Lange umfaBt, wobei jede Basenfa- 
milie spezifisch markiert ist und die Nukleotide jeder Kette markiert sind, wobei diese Markierun- 
gen mit stabilen Isotopen oder kleinen stabilen, direkt auf die Nukleotide der besagten Ketten 
implantierten Molekulen gemacht werden, 

- Gerate (22, 24) umfaBt, um die markierten Ketten eine nach der anderen in die Gerate zur 
Zerstaubung einzufiihren, 

- Gerate (26, 28, 30) zur Zerstaubung jeder markierten Kette umfaBt, 

- Gerate (32) zur lonisierung der abgetrennten und zerstaubten Ketten umfaBt, 

- ein Massenspektrometer (38) umfaBt, das mit m hreren Detektoren (42) ausgerUstet ist, um die 
gebildeten lonen je nach ihrer Bildung zu detektieren, und 
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- Gerate (46) zur Verarbeitung der von den Detektoren (42) gelieferten Signale, um die Lange jeder 
Kette zu bestimmen, indem man die Anzahl der markierten Nukleotide jedes detektierten Ions 
zahlt und um die spezifische Marki rung jeder Famili der Ketten zu identifizieren. 

AusrUstung gemSB Anspruch 8, dadurch gekennzeichnet, da8 die Gerate zur lonisierung einen 
Plasmabrenner (32) umfassen. 

Verfahren zur Identifikation der Grundeinheit eines komplexen organischen MolekUls mit sich wiederho- 
lender Struktur oder eines Fragments dieses Molekuls, welches die folgenden Abschnitte umfaBt: 

- spezifische Markierung (6) der besagten Grundeinheit durch stabile Isotopen oder kleine stabile, 
direkt in die besagten Grundeinheiten implantierten Molekule, 

- EinfUhrung (8) der markierten Grundeinheiten eine nach der anderen in die Gera'te zur ZerstSu- 
bung und lonisierung (26, 28, 30, 32), 

- Zerstaubung und lonisierung (10) jeder markierten Grundeinheit mithilfe der besagten Gerate, 

- Detektion (12) der gebildeten lonen in Echtzeit je nach ihrer Bildung durch Massenspektrometrie, 
und 

- Verarbeitung (14) der vom Massenspektro meter ausgegebenen Signale, um die Lange der 
komplexen Molekule oder des Fragments dieser Molekule zu bestimmen, indem die Anzahl der 
markierten Grundeinheiten gezahlt wird und um ihre spezifische Markierung zu identifizieren. 
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